Do Excel ao Pandas
Aprendendo a criar uma página de blog com Jupyter Notebook
Quando comecei a ver as primeiras coisas sobre análise de dados me deparei com a seguinte pergunta: “Quais as vantagens em se utilizar o Pandas no Python ao em vez do Microsoft Excel para análise de dados?”
Não penso que seja uma questão de escolha entre “Python & Pandas” ou “Excel”. Com o tempo passei a enxergá-los como duas ferramentas que se complementam. Eu não usaria o Pandas para procurar dados, mas você poderia. Tampouco usaria o Excel para limpar dados ou automatizar tarefas, mas você poderia. Acima de tudo, a pergunta é: “Quando usar um ou outro?”
O excel pode não ser o ideal se você realmente quer ser um cientista de dados, mesmo que você disponha de tempo para tratar os dados, possua uma base com poucos dados e personalizar visualmente suas planilhas.
O Pandas
O Pandas é uma biblioteca do Python que possui muitas características interessantes e de alto nível. Por exemplo: Com ele você consegue basicamente limpar e tratar os dados de uma forma muito rápida e extremamente amigável para ser usado em Excel posteriormente. Ou seja, você consegue eliminar dados faltantes ou substituí-los em lote, e ainda trabalhar de forma combinada com outras bibliotecas extremamente diversificadas do Python, pode fazer uma análise exploratória de seus dados sem ter que se quer visualizá-los, o que faz muito sentido quando falamos de uma base repleta de dados.
A biblioteca Pandas é indispensável para qualquer cientista de dados.